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摘要 :【 目的 】 研究 论文 的 某 些 相关 参数 是 否 会 影响 被 引 频次 。[ 方法 ] 采 用 多 种 措施 弱化 非 研 究 因素 的 干扰 , 并 
绘制 研究 因素 与 被 引 频 次 关系 的 各 年 代 曲 线 , 判断 研究 因素 对 被 引 频 次 的 影响 。[ 结果 】 作 者 人 数 、 页 码 数 、 参 
考 文献 数 和 文摘 长 度 与 被 引 频 次 呈正 相关 , 作者 关键 词 数量 和 平均 长 度 与 被 引 频 次 无 关 ， 而 不 同 的 题名 长 度 对 
被 引 频次 的 影响 不 同 。[ 局 限 】 由 于 数据 采样 条 件 限制 , 数据 均 采 自 SCIE 这 种 高 水 平 的 论文 数据 库 , 上 且 WOS 分 
类 为 Engineering 和 Mechanical， 所 得 结论 不 一 定 全 部 适用 于 其 他 主题 的 论文 。【 结论 ] 论文 的 某 些 相关 参数 对 论 


文 的 被 引 频 次 存在 影响 。 
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1 3 引 


在 我 国 , 论文 的 被 引 频 次 已 经 成 为 衡量 论文 和 作 
影响 力 的 一 个 重要 指标 , 日 益 受 到 评审 机 构 和 研究 
人 员 的 重视 , 也 日 益 受 到 期 刊 编辑 部 的 重视 。 如 何 提 
高 论文 的 被 引 频 次 是 研究 人 员 和 期 刊 编辑 普遍 关注 的 
问题 。 要 回答 这 个 问题 ,必须 首先 搞 清楚 有 哪些 因素 
会 影响 论文 的 被 引 频 次 , 这 些 因素 是 如 何 影响 被 引 频 
次 的 。 关 于 这 个 问题 , 已 有 研究 人 员 对 部 分 因素 做 了 
研究 。 作 者 撰写 论文 时 ,由 于 受 自身 的 学 科 知识 背景 、 
学 识 、 研 究 条 件 和 研究 水 平等 制约 , 使 得 论文 被 接受 
的 期 刊 及 期 刊 相关 因素 (如 期 刊 出 版 周期 、 发 文 量 、 研 
究 领 域 等 )、 被 收录 的 数据 库 等 因素 也 受到 制约 , 这些 
因素 都 可 能 会 对 被 引 频次 产生 影响 。 已 有 的 研究 认为 : 

(1) 文献 的 被 引 率 与 文献 的 体裁 相关 。 综 述 和 述 
评 被 引 明 显 高 于 应 用 和 实验 研究 类 0 

(2) 文献 的 被 引 率 与 研究 领域 (学 科 ) 有 关 053。 热 
门 的 研究 领域 被 引 率 高 于 冷门 研究 领域 5 

(3) 文献 的 被 引 频 次 受 期 刊 相 关 因 素 的 影响 。 期 
刊 的 影响 因子 越 高 ,文献 被 引 率 越 大 中 。 期 刊 的 出 版 周 
期 越 长 ， 发 文 量 越 高 , 文献 被 引 率 越 大 B; 期 刊印 刷 质 


了 中 


量 越 好 , 文献 被 引 率 越 高 [7 

(4) 编辑 部 对 篇 幅 的 规定 ， 编 辑 的 工作 态度 对 文 
献 被 引 率 有 一 定 的 影响 F 

(5) 收录 期 刊 的 数据 库 知名 度 越 高 , 被 引 率 越 高 
数据 库 分 布 的 范围 越 广 , 文献 被 引 率 越 高 [7 

(6) 论文 存在 的 形式 影响 被 引 率 。 论 文 的 获取 和 
传播 越 容 易 ， 被 引 率 越 高 ?1。 

还 有 一 些 论文 本 身 的 相关 参数 ， 如 标题 的 长 度 、 
关键 词 的 个 数 与 关键 词 的 长 度 、 文 摘 的 长 度 、 论 文 的 
长 度 、 参 考 文献 数 等 , 这 些 因素 是 否 也 会 影响 论文 的 
被 引 频 次 呢 ? 本 文 重点 研究 这 些 相 关 参 数 对 被 引 频 次 
的 影响 。 其 中 有 些 虽 有 文献 研究 , 但 是 不 同文 献 得 到 
的 结论 不 一 致 。 如 参考 文献 [1] 研 究 结论 是 “4-6 个 作者 
的 论文 被 引 率 和 篇 均 被 引 频 次 最 高 ,作者 数 多 于 7 个 
的 论文 , 篇 均 被 引 频 次 反而 低 于 4-6 个 作者 的 论文 ”; 
而 参考 文献 由] 的 结论 是 “期 刊 的 作者 数量 与 影响 因子 
成 正比 ”。 参 考 文献 [9] 认 为 : 论文 标题 长 度 和 论文 长 度 
对 被 引 频次 没有 明显 的 影响 ,关键 词 数 量 对 被 引 存 在 
明显 的 影响 。 而 参考 文献 [10] 却 认为 论文 的 长 度 对 被 
引 频 次 存在 影响 。 笔 者 也 对 此 做 了 研究 。 下 面 介绍 笔 
者 的 研究 思路 和 研究 方法 。 


通讯 作者 : 肖 学 斌 , ORCID: 0000-0003-1933-5006,， E-mail: 00201493@whu.edu.cn。 
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2 ”相关 参数 对 被 引 频 次 的 影响 研究 


2.1 凸显 特定 因素 影响 到 措施 

由 于 同时 影响 论文 被 引 频 次 的 因素 很 多 , 为 了 研 
究 其 中 一 个 因素 与 被 引 频 次 的 关系 , 需要 采取 许多 措 
施 来 弱化 其 他 因素 和 相关 参数 的 影响 , 凸显 特定 因素 
的 影响 。 措 施 如 下 : 

(1) 限定 所 收录 数据 库 。 由 于 数据 库 对 论文 的 被 
引 频 次 有 影响 ， 所 以 限定 数据 库 , 保持 文献 所 收 
录 数 据 库 的 一 致 性 ， 可 以 弱化 数据 库 对 论文 被 引 
频次 的 影响 。 笔 者 只 选用 SCIE 数据 库 作 为 采样 数 
据 源 。 

(2) 保持 文献 水 平 的 一 致 性 。 由 于 所 采样 数据 都 
来 源 于 SCIE 这 一 国际 公认 的 , 代表 高 水 平 研究 论文 
的 数据 库 ， 可 以 保证 所 选 论文 有 较 多 的 文献 被 引 ， 
避免 由 于 被 引 论文 数量 过 少 导 致 结果 不 明显 或 者 失 
真 。SCI 论文 的 被 引 情况 也 是 学 术 评 价 关注 的 重点 
之 一 。 

(3) 限定 主题 。 由 于 主题 研究 领域 对 被 引 频 次 有 
较 大 影响 03, 笔者 于 2015 年 9 月 25 日 在 SCIE 数据 
库 中 检索 2010 年 -2012 年 WOS 分 类 包含 Engineering 
和 Mechanical 的 全 部 文献 ， 检索 得 到 46 378 条 记 
录 ， 从 而 保证 检索 出 的 文献 主题 研究 领域 比较 接 
近 ,， 弱化 由 于 主题 研究 领域 不 同 造成 的 被 引 频 次 的 


(4) 限定 出 版 物 类 型 。 在 SCIE 数据 库 中 所 收录 的 
出 版 物 类 型 有 期 刊 、 图 书 、 丛 书 、 专 利 4 种 类 型 , 为 
了 防止 出 版 物 类 型 可 能 对 被 引 频 次 造成 的 影响 , 滤 掉 
非 期 刊 类 型 的 记录 9 条 , 再 去 掉 6 条 信息 不 全 的 记录 ， 
最 终 得 到 46 363 条 期 刊 论文 记录 。 

(5) 大 数据 量 。 众所周知 ， 取 大 数据 量 的 平均 值 可 
以 弱化 偶然 因素 的 影响 , 凸显 出 主要 趋势 ， 显 现 普遍 
规律 。 笔 者 样本 数 高 达 46 363 。 而 参考 文献 [1-10] 中 最 
大 样本 数 为 5 716 中 , 最少 的 只 有 几 十 个 , 大 多 数 总 样 
本 数 不 足 1 000。 

(6) 移动 平均 法 ,由 于 影响 论文 被 引 频 次 的 因素 
很 多 ,尽管 采用 了 上 面 的 种 种 措施 ,依然 不 能 完全 
消除 其 影响 ， 导 致 某 些 地 方 波动 幅度 过 大 ， 因 此 有 
时 有 必要 利用 移动 平均 法 弱化 异常 波动 以 保持 总 体 
变化 趋势 。 
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2.2 ”研究 及 判断 方法 

首先 将 原 记 录 导 入 Excel 中 , 运用 VBA 提取 原始 
记录 表 中 的 被 引 频 次 、 发 表 年 代 、 页 码 数 、 作 者 数 、 
参考 文献 数 、 基 金 支 持 等 字段 数据 保存 于 男 一 张 数据 
表 中 , 计算 题名 长 度 (单词 数 )、 文 摘 长 度 ( 单 词 数 )、 关 
键 词 数量 、 关 键 词 长 度 等 数据 , 也 存放 于 上 面 的 数据 
表 中 。 并 计算 各 种 情形 下 的 平均 被 引 频次 ， 其 中 , 由 于 
文摘 长 度 跨度 、 参 考 文献 数 跨度 巨大 , 许多 具体 情况 
对 应 的 数量 可 能 会 比较 少 , 甚至 为 0, 故 取 几 个 相 邻 
量 的 平均 值 来 进行 分 析 。 

然后 对 数据 进行 排序 , 凸显 被 研究 因素 。 例 如 , 在 
分 析 论 文 长 度 (用 页 码 数 表 示 ) 与 被 引 频 次 关系 的 时 候 ， 
由 于 论文 的 被 引 频 次 会 随时 间 累 积 ， 因 此 分 年 统计 ， 
先 按照 出 版 年 代 升 序 排列 ,将 不 同年 代 的 论文 分 开 ; 
接着 按照 页 码 数 ( 相 关 参 数 ) 升 序 排列 以 凸显 页 码 数 的 
影响 效果 。 以 页 码 数 作为 自 变 量 , 被 引 频 次 作为 因 变 
量 , 绘制 关系 图 , 得 到 三 条 平均 被 引 频 次 关于 论文 页 
码 数 的 曲线 。 如 果 这 三 条 曲线 图 形 基 本 一 致 ， 则 表示 
该 趋势 具备 普遍 性 ,否则 可 能 出 现 了 错误 ; 如 果 三 条 
曲线 总 趋 热 (上升 、 下 降 ) 基 本 一 致 ， 则 表示 该 因素 对 论 
文 被 引 频次 有 影响 ; 如 果 三 条 曲线 总 趋势 都 是 水 平 的 
则 没有 影响 ;如果 三 条 曲线 一 致 ,但 是 各 阶段 趋势 不 
同 ， 则 表示 不 同 阶段 自 变量 对 被 引 频 次 影响 不 同 。 这 
是 判断 相关 参数 是 否 影响 被 引 频 次 的 依据 。 笔 者 采用 
这 种 方法 , 研究 了 页 码 数 、 作 者 数量 、 题 名 长 度 、 文 
摘 长 度 、 作 者 关键 词 数 量 及 平均 长 度 、 参 考 文献 数 和 
是 否 基金 支持 等 因素 与 平均 被 引 频次 的 关系 , 并 根据 
计算 结果 绘制 成 图 ， 如 图 1- 图 8 所 示 : 
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图 1 页 码 数 与 被 引 频次 的 关系 
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图 4 关键 词 长 度 与 被 引 频 次 的 关系 
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图 5 题名 长 度 与 被 引 频 次 的 关系 
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图 6 文摘 长 度 与 被 引 频 次 的 关系 
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图 8 基金 支持 与 被 引 频 次 的 关系 
2.3 ”相关 性 分 析 


为 了 确定 平均 被 引 频 次 与 前 面 所 述 相关 参数 之 间 
是 否 确实 存在 关系 ,笔者 调用 Excel 的 相关 性 函数 
Correl 计算 其 间 的 相关 性 , 包括 与 各 年 平均 被 引 频次 
的 相关 性 , 与 全 部 平均 被 引 频 次 的 相关 性 , 为 了 减少 
偶然 因素 的 影响 ,特地 分 析 了 子 样本 数 大 于 10 的 情况 
下 与 平均 被 引 频 次 的 相关 性 ， 相关 性 检验 结果 如 表 1 
所 示 。 
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表 1 相关 参数 与 平均 被 引 频 次 的 相关 度 
和 全 部 论文 人 
2010 2011 2012 至 2010 2011 2012 三 年 相关 度 

页 码 数 0.754 0.793 0.872 0.797 0.919 0.954 0.838 0.950 非常 高 
作者 数 0.810 0.799 0.807 0.649 0.900 0.727 0.823 0.924 非常 高 
关键 词 数 0.520 0.363 0.213 0.461 0.520 0.363 0.213 0.461 低 
关键 词 长 度 0.189 0.189 —0.214 0.487 0.189 0.189 —0.214 0.487 低 
题名 长 度 0.567 0.297 0.434 0.447 0.678 0.687 0.566 0.447 低 
题名 长 度 入 8 0.955 0.862 0.952 0.935 0.955 0.862 0.952 0.935 非常 高 
文摘 长 度 0.688 0.816 0.536 0.822 0.628 0.803 0.467 0.808 高 
参考 文献 数 0.932 0.954 0.977 0.986 0.906 0.957 0.977 0.986 非常 高 

在 相关 分 析 中 ， 一 般 根 据 相 关 度 r 的 数值 大 小 ，“ 故 可 以 得 出 结论 ,页 码 数 、 作 者 数 、 人 参考 文献 数 以 及 


将 不 完全 线性 相关 的 密切 程度 分 为 4 个 等 级 : 0 雪上 叫 乏 
0.3, 微弱 相关 ; 0.3 二 Ir 三 0.5, 低 度 相关 ; 0.5 二 | 志 0.8， 
中 度 相 关 ; 0.8 雪 叫 科 1 高度 相 关 [。 据 此 标准 , 在 表 1 
中 ， 当 参与 统计 论文 数 大 于 10 时 ， 有 4 个 相关 参数 与 被 
引 频 次 的 相关 性 非常 高 ， 相 关 度 大 于 0.92, 分 别 是 页 
码 数 、 作 者 数 、 参 考 文献 数 和 题名 长 度 夺 8 时 的 题名 长 
度 , 文摘 长 度 也 与 被 引 频 次 有 较 高 的 相关 性 ， 相关 度 
大 于 0.8， 而 关键 词 数 、 关 键 词 长 度 和 全 部 题名 长 度 的 
相关 性 低 , 均 小 于 0.5。 如 果 用 全 部 论文 数 时 计算 , 只 
有 题名 长 度 夺 8 时 和 参考 文献 数 与 被 引 频 次 的 相关 性 
非常 高 , 分 别 是 0.935 和 0.986; 页 码 数 、 作 者 数 和 文摘 
长 度 与 被 引 频 次 中 度 相关 ， 相关 度 在 0.649-0.822 之 间 。 

表 2 


题名 长 度 过 8 对 被 引 频 次 有 明显 的 影响 。 两 种 方式 之 间 
相关 性 差异 主要 是 由 于 偶然 因素 造成 的 。 
2.4 数据 分 析 结 果 及 结论 

从 总 体 上 看 , 图 1- 图 8 中 ,2010 年 的 平均 被 引 频 
次 都 是 最 高 ,2012 年 的 都 是 最 低 , 符合 被 引 频 次 随时 
间 累 积 的 规律 ; 而 且 图 1- 图 7 中 各 自 的 三 条 曲线 都 大 
体 相似 , 图 8 中 基金 支持 与 非 基金 支持 的 论文 平均 被 
引 频 次 比 也 大 臻 相等, 分 别 为 1.86、1.70、1.80， 都 说 
明 这 些 图 确实 反映 了 论文 平均 被 引 频 次 与 这 几 种 相关 
参数 的 关系 。 虽然 每 幅 图 各 自 的 三 条 曲线 的 趋势 相似 ， 
但 是 不 同 图 的 曲线 却 有 差异 (包括 倾斜 度 和 形状 )。 将 
图 1- 图 7 和 表 1 结合 起 来 , 得 出 结论 如 表 2 所 示 : 


论文 相关 参数 对 被 引 频 次 影响 


相关 参数 图 形 曲线 趋势 相关 性 结论 
页 码 数 明显 上 升 非常 强 被 引 频 次 与 论文 长 度 密切 正 相关 
作者 数 逐渐 上 升 非常 强 被 引 频次 与 作者 数 密切 正 相关 
关键 词 数 无 明显 趋势 弱 关键 词 数 与 被 引 频次 无 关 
关键 词 长 度 无 明显 趋势 弱 关键 词 长 度 与 被 引 频 次 无 关 
题名 长 度 无 固定 趋势 弱 题名 长 度 对 被 引 频次 影响 不 确定 
题名 长 度 <8 逐渐 上 升 非常 强 题名 长 度 <8 与 被 引 频次 密切 正 相关 
文摘 长 度 缓慢 上 逢 强 文摘 长 度 与 被 引 频次 正 相关 
参考 文献 数 缓慢 上 逢 非常 强 被 引 频 次 与 参考 文献 数 密切 正 相 关 
图 8 显示 受 基 金 支 持 的 论文 被 引 频次 更 高 。2010 ” 持 的 论文 数 (基金 支持 比例 逐年 提高 ,是 否 表示 SCIE 


年 -2012 年 有 基金 支持 的 论文 数 分 别 是 6 368，7 502， 
8 680; 无 基金 文 持 的 论文 数 分 别 是 8 252, 7 946， 
7615。 这 三 年 的 数据 正好 代表 了 三 种 情况 : 2010 年 有 
基金 支持 的 论文 数 明 显 低 于 无 基金 支持 的 论文 数 ; 
2011 年 两 者 基本 持平 ; 2012 年 则 明显 高 于 无 基金 支 


论文 更 青睐 于 基金 支持 论文 ” 有待 研究 )。 但 是 无 论 
哪 种 情况 ， 有 基金 支持 的 论文 平均 被 引 频 次 都 明显 
高 于 无 基金 支持 的 论文 的 被 引 频 次 。 这 表明 基金 支持 
对 文献 的 被 引 频次 有 明显 的 影响 ,与 文献 [12-14] 结 
论 一 致 。 


XIANDAI TUSHU QINGBAO JISHU 地 纹 


广 | ”Vi 人 人 [人生 甘 日 工 | 
ChinaXiv 合作 期 逢 


研究 文 


2.5 ”相关 参数 与 被 引 频 次 的 关系 理论 分 析 

不 可 否认 , 一 篇 论文 是 否 会 被 引用 ,引用 者 必须 
经 历 论文 的 发 现 、 获 取 、 赔 读 和 引用 4 个 阶段 (学 术 造 
假 除外 )。 被 发 现 、 被 获取 和 被 阅读 是 被 引用 的 先决 条 
件 ， 也 就 是 说 , 论文 越 容易 被 发 现 , 被 引用 的 可 能 性 
就 越 大 ; 论文 全 文 越 容易 被 获取 , 被 引用 的 可 能 性 也 
越 大 ”0。 网 络 时 代 , 利用 网 络 查 找 文 献 的 方式 可 分 
为 两 种 : 直接 利用 搜索 引擎 查找 和 获取 , 这 是 大 多 数 
人 采用 的 方式 , 因为 其 便宜 、 快 捷 、 门 槛 低 " 利用 
专业 文献 数据 库 查找 , 由 于 专业 文献 数据 库 使 用 费用 
比较 昂贵 ,一 般 高 校 每 年 会 花费 几 百 万 到 几 千 万 元 的 
经 费 购 买 数据 库 的 使 用 权 , 而且 使 用 专业 文献 数据 库 


需要 学 习 相关 的 检索 知识 ， 因 此 这 种 方式 只 有 那些 拥 
有 这 些 专业 文献 数据 库 使 用 权限 的 单位 和 个 人 才 可 能 
采用 。 搜 索引 擎 查找 一 般 是 模糊 匹配 方式 即 搜 索引 
擎 会 将 检索 词 拆 散 ， 甚 至 拆 成 单字 或 单词 ， 然 后 在 搜 
索引 警 数据 库 中 进行 匹配 , 并 将 匹配 结果 根据 相关 度 
从 高 到 低 进 行 排序 59。 从 这 个 理论 出 发 ,很 容易 解释 
被 引 频次 与 文献 长 度 、 文 摘 长 度 正 相关 的 关系 。 研 究 
人 员 通 常会 用 几 个 检索 词 来 查找 所 需要 的 文献 ， 而 全 
文 和 文摘 比较 长 , 检索 词 可 以 出 现在 不 同 的 句子 中 ， 
全 文 越 长 .文摘 越 长 ,被 命中 的 几率 就 越 大 ,因而 被 引 
用 的 可 能 性 就 更 大 。 

可 能 有 人 会 将 这 个 结论 推广 到 论文 题名 ， 从 而 认 
为 : 题名 越 长 , 被 引 频 次 越 高 。 但 是 , 图 5 显示 的 被 引 
频次 与 题名 长 度 的 关系 并 非 如 此 。2010 年 -2012 年 的 
曲线 均 是 : 当 题 名 长 度 小 于 8 时 , 被 引 频 次 随 题名 的 
长 度 快 速 增加 ; 当 题名 长 度 在 8-20 之 间 , 被 引 频次 变 
化 缓慢 ; 当 题 名 长 度 超过 20 之 后 , 被 引 频 次 反而 随 着 
题名 长 度 的 增加 而 降低 。 由 于 三 条 曲线 情况 基本 一 致 ， 
说 明 这 种 变化 不 是 偶然 ,而 是 必然 ,究竟 是 什么 原因 
造成 的 呢 ? 为 此 , 笔者 做 了 专门 研究 。 

首先 针对 题名 单词 数 大 于 20 的 记录 ,提取 被 引 频 
次 .题名 本 身 和 单词 数 , 存放 于 一 个 单独 的 Excel 工作 
表 中 , 得 到 1378 条 记录 ,按照 被 引 频 次 从 低 到 高 排序 ， 
发 现 很 多 论文 是 对 另外 一 篇 论文 的 评述 (以 Comments 
on 开头 )、 回 复 (以 Reply to 或 Response to 开头 )、 讨论 
(以 Discussion of 开头 ) 或 者 收回 论文 的 申明 (以 Closure 
to 开头 ) 等 , 这 些 题名 中 除了 包含 另 一 篇 论文 的 题名 
外 ,还 包含 其 作者 、 刊 名 、 年 卷 期 页 码 等 信息 ， 从 而 导 
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致 论文 题名 很 长 。 这 样 的 论文 有 104 篇 , 平均 单词 数 
约 为 26, 共计 被 引 50 次 , 平均 被 引 频次 仅 为 0.48, 其 
中 有 79 篇 被 引 频次 为 0, 约 占 75.96%。 这 些 论文 都 有 
很 强 的 针对 性 ,对 大 多 数 其 他 作者 的 研究 意义 不 大 ， 
从 而 导致 被 引 频 次 低 。 

在 去 掉 这 些 论文 后 , 计算 结果 显示 : 当 题 名 长 度 
超过 20 后 ， 随 着 题名 长 度 的 增加 , 被 引 频次 总 体 上 依 
然 逐渐 降低 。 笔 者 根据 上 述 104 篇 论文 的 被 引 情 况 猜 
测 是 由 于 论文 的 专 指 度 太 高 导致 的 。 一 篇 论文 被 发 现 
后 ,是否 阅读 , 最 终 还 处 决 于 引用 者 的 研究 兴趣 与 被 
引 论文 所 涉及 的 研究 内 容 的 相关 程度 。 虽然 题名 越 长 ， 
文献 检索 时 被 命中 的 几率 越 大 ; 但 同时 , 题名 越 长 ， 
题名 所 包含 的 独立 概念 越 多 ， 表 示 所 研究 的 内 容 越 具 
体 , 研究 范围 越 窗 。 如 图 9 所 示 , A、B、C 各 表示 论文 
题名 中 涉及 一 个 独立 概念 的 文献 范围 ,独立 的 意思 是 
三 个 概念 相互 之 间 不 存在 隶属 关系 ; E( 中 间 阴 影 区 域 ) 
表示 同时 包含 A、B、C 三 概念 的 文献 范围 。 可 以 看 出 ， 
E 区 域 所 在 范围 比 任何 一 个 概念 所 占 区 域 小 得 多 。 科 
技 论文 的 标题 通常 只 有 一 个 句子 , 是 对 论文 表达 内 容 
的 高 度 概 括 ， 全 面 或 从 不 同 的 侧面 体现 作者 的 写作 意 
图 研究 主题 或 体现 论文 的 亮点 。 如 果 题 名 比较 长 , 研 
究 人 员 可 能 会 因为 其 中 的 某 些 概念 与 自己 的 研究 兴趣 
相去 较 远 而 忽视 这 篇 论文 ， 自 然 不 会 引用 ; 题名 越 长 ， 
独立 概念 越 多 , 被 忽视 的 可 能 性 越 大 ,因此 , 论文 题名 
过 长 , 反而 会 导致 被 引 频 次 降低 。 被 命中 的 概率 和 被 
关注 的 概率 , 这 两 个 因素 同时 影响 着 被 引 频 次 , 题名 
越 长 , 被 命中 的 概率 越 大 , 同时 被 关注 的 概率 越 低 。 图 
5 可 能 是 这 两 种 因素 的 影响 释 加 的 结果 。 


图 9 多 独立 概念 交叉 范围 也 
图 2 显示 论文 的 平均 被 引 频次 随 着 作者 的 人 数 增 
加 而 增加 。 一 篇 论文 的 多 个 作者 必然 有 共同 的 研究 兴 
趣 , 在 后 续 的 研究 中 , 通常 会 相互 关注 其 他 成 员 的 研 
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究 成 果 ，, 因此 团队 成 员 间 研究 成 果 的 引用 几率 呈 几 何 
倍数 增加 。 同 时 ， 由 于 各 作者 还 可 能 有 自己 的 研究 团 
队 , 各 作者 自己 的 团队 成 员 也 可 能 会 关注 该 论文 , 也 
会 导致 论文 的 被 引 频 次 增加 。 
图 3 和 图 4 显示 的 论文 作者 关键 词 个 数 以 及 长 度 
均 对 平均 被 引 频次 没有 明显 的 影响 。 参 考 文献 [15] 研 
究 表明 : 在 检索 文献 时 , 多 达 90% 的 大 学 生 经 常 使 用 
搜索 引擎 , 仅 有 约 37% 的 大 学 生 使 用 过 中 国 期 刊 全 文 
数据 库 。 这 就 是 说 , 搜索 引擎 是 大 学 生 查 找 参 考 资料 
的 首选 工具 。 大 学 生 有 免费 文献 数据 库 的 使 用 权限 ， 
许多 学 生还 学 习 过 文献 检索 课 , 懂得 数据 库 的 使 用 方 
法 , 他 们 尚且 以 搜索 引擎 为 主 ,其 他 无 法 使 用 专业 数 
据 库 的 人 则 别 无 选择 。 在 使 用 搜索 引擎 检索 文献 时 ， 
大 多 数 检索 词 实际 上 是 自由 词 ， 甚 至 是 自然 语言 ， 而 
且 大 多 数 作者 关键 词 数 量 比较 少 (通常 在 5 个 左右 )， 
能 够 同时 匹配 几 个 检索 词 的 几率 非常 低 , 故 作者 关键 
词 对 被 引 频 次 影响 不 明显 。 

7 显示 了 参考 文献 数 与 被 引 频 次 成 正 相 关 的 关 
系 。 总 体 上 说 , 参考 文献 数 越 多 , 文献 的 被 引 频 次 越 
高 。 因 为 参考 文献 越 多 ,在 研究 时 用 于 查找 、 阅 读 、 
学 习 所 花费 的 时 间 越 长 ,掌握 的 资料 和 理论 更 全 面 、 
更 准确 ， 层次 更 深 , 得 出 的 结论 更 可 靠 , 因而 论文 质 
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一 定 全 部 适合 其 他 主题 分 类 。 

(3) SCIE 数据 库 是 一 个 英文 文摘 型 数据 库 ， 即 使 
原始 文献 语种 非 英 语 , 在 SCIE 中 都 是 以 英文 表示 。 由 
于 语种 的 差异 ， 导 臻 题名、 文摘 等 长 度 计数 可 能 存在 
差异 。 另 外 由 于 SCIE 中 偶尔 有 数据 不 完备 的 情况 存 
在 ， 如 ， 某 些 论文 题名 为 “Untitle”， 有 些 作 者 为 空 等 ， 
也 或 多 或 少 地 影响 计算 结果 。 

(4) 这 些 相关 参数 本 身 在 各 数据 段 的 分 布 并 不 均 
句 。2010 年 题名 长 度 为 11 的 论文 数 就 有 1 413 篇 ， 而 
三 年 的 全 部 数据 中 , 题名 长 度 超过 20 的 论文 总 数 只 有 
1 378 条 , 分 布 跨度 约 占 全 部 的 40%( 题 名 最 小 长 度 为 
1, 最 大 为 52), 数据 量 却 只 有 不 到 全 部 数据 的 3%， 这 
种 不 均匀 分 布 也 导致 平均 值 受到 偶然 因素 的 影响 程度 
有 差异 ,数量 越 少 , 受 影响 的 程度 越 高 ,这 也 是 笔者 
特地 针对 论文 数 大 于 10 的 情况 做 统计 分 析 的 原因 。 尽 
管 如 此 , 也 不 能 完全 消除 这 种 由 于 数量 少 带 来 的 影响 ， 
1- 图 7 两 端 异常 情况 或 许 就 源 于 此 。 


4 结 语 

影响 文献 被 引 频 次 的 因素 包括 很 多 , 在 相关 参数 
中 , 论文 长 度 、 文 摘 长 度 、 参 考 文献 数 和 作者 数量 以 
及 基金 支持 对 文献 的 被 引 频次 产生 正 相关 影响 ; 题名 


量 更 高 , 被 引用 的 可 能 性 越 大 同时， 由 于 该 论文 与 
参考 文献 具有 较 强 的 相关 性 , 会 受到 其 参考 文献 作者 
的 关注 ,参考 文献 越 多 , 受到 的 关注 越 多 , 也 增 大 了 被 


长 度 也 会 影响 被 引 频 次 , 但 是 其 影响 变化 趋势 随 长 度 
不 同 而 不 同 。 由 于 笔者 的 研究 结论 都 是 基于 SCIE 数 
据 库 中 的 Engineering 和 Mechanical 主题 得 到 的 ,因此 


引 可 能 性 。 另 外 ,检索 参考 文献 也 是 用 来 查找 相关 研 
究 资料 的 一 种 重要 途径 。 


3 研究 存在 的 问题 和 局 限 性 


笔者 选用 WOS 中 的 SCIE 数据 库 作为 数据 来 源 ， 
一 方面 是 为 了 弱化 某 些 因素 的 影响 ; 另 一 方面 也 为 了 
获取 的 数据 更 有 意义 ,因为 在 国内 SCI 论文 及 其 被 引 
情况 受到 国内 学 术 界 和 科技 部 门 广 泛 的 关注 , 且 数 据 
采样 比 其 他 数据 库 方便 , 却 也 大 费 周折 。 由 于 笔者 有 限 
的 数据 采样 条 件 ， 可 能 带 来 研究 的 局 限 性 , 列举 如 下 : 

(1) SCIE 论文 是 高 水 平 论文 的 代表 , 那么 低 水 平 
论文 的 被 引 情况 未 得 到 证 实 , 因此 本 人 研究 结论 主要 适 
用 于 高 水 平 论文 。 

(2) 由 于 研究 数据 属于 WOS 的 Engineering， 
Mechanical 主题 , 并非 全 部 主题 , 故 所 得 到 的 结论 不 


是 否 全 部 适用 于 其 他 论文 还 有 待 进一步 研究 。 
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Properties of Scholarly Papers and Number of Citations 
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Abstract: [Objective] To examine the ties between properties of scholarly papers and the number of citations they 
received. [Methods] First, we adopted various measurements to reduce the influence of irrelevant factors. Second, we 
drew trending lines to analyze the relationship between the target properties and the number of citations for a period of 
three years. [Results] There was positive correlation between some properties, such as the numbers of authors, pages 
and references, as well as the length of abstract, and the number of citations. In the meantime, there ls no relationship 
between the number of keywords and the number of citations. The titles posed mixed effects to the number of citations. 
[Limitations] All samples were collected from the SCIE database in the fields of Engineering and Mechanical. We 
might not be able to get similar results from other areas. [Conclusions] Specific properties of the paper pose positive 
effects to the number of citations. 
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Ex Libris 和 CLA 合作 促进 学 生 获 取 数 字 化 内 容 


ProQuest 子 公司 Ex Libris 和 英国 版 权 许 可 代理 机 构 (Copyright Licensing Agency, CLA) 于 近日 宣布 了 他 们 在 数字 内 容 商 店 
(Digital Content Store, DCS)URL API 上 的 合作 。 此 次 合作 将 有 利于 数字 内 容 商 店 .Ex Libris Alma 资源 管理 解决 方案 和 Leganto 
阅读 清单 解决 方案 之 间 的 整合 。Ex Libris 是 致力 于 帮助 DCS URL API 发 展 的 众多 协作 伙伴 中 的 一 员 。 

DCS 是 一 个 为 高 等 教育 机 构 (Higher Education Institutions, HEIS) 提 供 创 新 权利 、 技 术 和 内 容 的 平台 。 这 一 平台 目前 正 由 
CLA 和 HEIs、 出 版 商 , 以 及 技术 伙伴 协作 开发 。DCS 平台 的 核心 包括 一 个 可 查询 的 PDF 文档 资源 库 ( 从 HEIs 数字 化 内 容 中 
复印 或 抽取 ), 以 及 一 个 工作 流程 管理 工具 。 当 一 个 机 构 在 CLA 的 许可 下 将 其 内 容 数字 化 , PDF 文档 将 会 被 直接 上 传 到 DCS 
上 , 之 后 即 可 用 于 分 配给 一 个 特定 的 课程 。 学 生 可 以 通过 DCS 上 的 一 个 安全 链接 访问 文档 内 容 。 最 为 重要 的 是 , 授课 教师 能 
够 从 中 发 现 已 经 被 外 部 机 构 上 传 的 数字 化 内 容 ， 并 将 这 些 内 容 分 配 到 相应 的 课程 。 

有 了 新 的 URL APL Alma 和 Leganto 将 能 够 在 DCS 平台 上 检索 URL 指向 的 数字 化 内 容 , 使 得 研究 人 员 和 学 生 可 以 通过 
Leganto 阅读 列表 访问 相应 的 链接 。 通过 充分 利用 其 他 HEIs 已 经 数字 化 的 内 容 , 图 书馆 可 以 大 大 节省 为 自己 的 用 户 进行 内 容 
数字 化 的 时 间 和 精力 。 

CLA 战略 和 数字 部 主任 Eela Devani 评论 , “简化 用 户 的 版 权 结算 流程 是 CLA 现行 使 命 的 一 部 分 。 我 们 正 与 Ex Libris 合 
作 , 将 Leganto 和 Alma 解决 方案 与 DCS 整合 在 一 起 。 通 过 整合 Leganto 、Alma 和 CLA 新 的 权利 和 内 容 管理 平台 (DCS), 提 
供 一 个 简化 的 工作 流 管理 工具 , 这 一 合作 将 为 研究 机 构 节省 大 量 的 时 间 和 精力 。” 

Ex Libris Alma 产品 管理 部 门 主任 Asaf Kline 解释 , “Alma 和 Leganto 与 DCS 之 间 的 合作 是 我 们 之 前 做 过 的 CLA 的 权限 
检查 工具 API 工作 的 继续 。 此 次 整合 将 提供 一 个 终端 到 终端 的 工作 流程 ， 从 Leganto 的 一 个 内 容 请 求 开始 , 到 Alma 和 DCS 
API 的 许可 并 提供 材料 ， 直 到 将 其 传递 给 机 构 内 学 生 为 止 。 整 个 过 程 的 执行 将 比 我 们 想象 的 更 加 简单 、 便 捷 。” 

(编译 自 : http://librarytechnology.org/news/pr.pl?id=21696) 
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